Neste trabalho utilizou-se uma estratégia com base em mineração de textos para fornecer uma indicação dos atuais portfólios da Embrapa Informática Agropecuária. Para tanto, utilizaram-se, como dados, os projetos liderados por essa unidade nos últimos anos, de 2004 a 2010. A esses dados aplicou-se um processo de extração semiautomática do conhecimento, utilizando vocabulário controlado, filtragem estatística de atributos, agrupamento hierárquico de documentos, descrição única dos agrupamentos e várias interações usuários do processo. Os resultados obtidos foram satisfatórios, tendo passado apenas por validação subjetiva, mostrando que o processo pode ser aplicado a dados semelhantes. |